当前位置: 开发笔记 > 编程语言 > 正文

物体|分校_ICLR2022：AI如何识别“没见过的东西”？

作者：我hi7娘 | 来源：互联网 | 2023-10-11 09:58

篇首语：本文由编程笔记#小编为大家整理，主要介绍了ICLR2022：AI如何识别“没见过的东西”？相关的知识，希望对你有一定的参考价值。行早发自凹非寺

篇首语：本文由编程笔记#小编为大家整理，主要介绍了ICLR 2022：AI如何识别“没见过的东西”？相关的知识，希望对你有一定的参考价值。

行早发自凹非寺
量子位 | 公众号 QbitAI

这回域外物体检测方向出了一个新模型VOS&＃xff0c;合作团队来自威斯康星大学麦迪逊分校&＃xff0c;论文已收录到ICLR 2022中。

这一模型在目标检测和图像分类上均达到目前最佳性能&＃xff0c;FPR95指标比之前最好的效果还降低了7.87%之多。

要知道深度网络对未知情况的处理一直是个难题。

例如在自动驾驶中&＃xff0c;识别已知物体&＃xff08;例如汽车、停车标志&＃xff09;的检测模型经常“指鹿为马”&＃xff0c;对域外物体&＃xff08;OOD&＃xff09;会产生高置信度的预测。

就像下图中的一头驼鹿&＃xff0c;在Faster-RCNN模型下被识别成了行人&＃xff0c;还有89%的置信度。

因此域外物体的检测无疑成为了AI安全方面一个很重要的话题。

我们来看看这个模型是怎么对域外物体做出判断的。

VOS如何检测域外物体

在理解VOS之前&＃xff0c;不得不提一下域外物体检测困难的原因。

其实也很好理解&＃xff0c;毕竟神经网络只是学习训练和测试时的数据&＃xff0c;遇到没见过的东西时自然不认识。

为了解决这个问题&＃xff0c;得想办法让网络认识“未知”的事物。这怎么办&＃xff1f;

VOS想到的办法是&＃xff0c;给模型模拟一个域外物体用来学习。

例如下图中的检测情况&＃xff0c;其中三团灰点是我们的目标。在没有模拟域外物体时&＃xff08;左&＃xff09;&＃xff0c;模型只能在大范围内圈住目标。

而在用模拟域外物体训练后&＃xff08;右&＃xff09;&＃xff0c;模型可以紧凑准确的锁定目标&＃xff0c;形成更合理的决策边界。

而一旦目标锁定更精确&＃xff0c;只要在这个范围之外&＃xff0c;其他物体就可以都判为域外物体。

基于这个想法&＃xff0c;VOS的团队构建了这样的框架&＃xff1a;

以一个Faster-RCNN网络为基础&＃xff0c;在分类头中加入一部分模拟域外物体的数据&＃xff0c;和训练集中的数据放在一起&＃xff0c;共同构建标准化的不确定性损失函数。

而这些模拟域外物体的数据从哪里来呢&＃xff1f;在结构图中可以看出&＃xff0c;这些点都来自目标区域&＃xff08;蓝色圆点、黄色方点和绿色三角点&＃xff09;周围&＃xff0c;也就是低似然区域。

最后根据置信度的计算&＃xff0c;蓝色代表目标检测数据&＃xff0c;绿色代表域外物体。

以此判断出图像中的车和驼鹿。

再和许多其他域外物体检测方法做一下比较&＃xff0c;就可以看出VOS的优势。

各项指标中箭头向下代表该项数据越小越好&＃xff0c;反之代表该项越大越好。

其中FPR95这项最为突出&＃xff0c;描述的是OOD样本分类正确率在95%时&＃xff0c;OOD样本被错分到ID样本中的概率。

这项成绩相较于之前最好的成绩降了7.87%。

与现有的其他方法相比&＃xff0c;也展现出了VOS的优势。

它作为一个通用学习框架&＃xff0c;可以适用于目标检测和图像分类两种任务。而之前的方法主要靠图像分类来驱动。

目前该模型已经在GitHub上开源。

作者简介

该模型主要由杜学峰、蔡沐等人提出。

杜学峰本科毕业于西安交通大学&＃xff0c;目前在威斯康星大学麦迪逊分校攻读CS博士。

主要研究方向是可信机器学习&＃xff0c;包括域外物体检测、对抗鲁棒性、噪声标签学习等。

蔡沐&＃xff0c;本科也毕业于西安交通大学&＃xff0c;目前为威斯康星大学麦迪逊分校CS博二学生。

研究兴趣集中在深度学习、计算机视觉&＃xff0c;尤其是三维场景理解&＃xff08;点云检测&＃xff09;和自监督学习。

该篇论文的通讯作者是Sharon Yixuan Li&＃xff0c;目前在威斯康星大学麦迪逊分校任计算机科学助理教授&＃xff0c;之前还曾在Facebook AI任研究员。

参考链接&＃xff1a;

[1]https://twitter.com/martin_gorner/status/1489671903727915008
[2]https://arxiv.org/abs/2202.01197
[3]https://sites.google.com/view/mucai
[4]https://www.linkedin.com/in/xuefeng-du-094723192/details/experience/
[5]https://github.com/deeplearning-wisc/vos

推荐阅读

ip
Python 数据可视化实战指南

本文详细介绍如何使用 Python 进行数据可视化，涵盖从环境搭建到具体实例的全过程。 ... [详细]

蜡笔小新 2024-11-13 06:03:30
ip
字节跳动深圳研发中心安全业务团队正在火热招募人才！

字节跳动深圳研发中心安全业务团队正在火热招募人才！ ... [详细]

蜡笔小新 2024-11-02 18:55:30
select
Java 15 发布，带来多项重要更新！

2020年9月15日，Oracle正式发布了最新的JDK 15版本。本次更新带来了许多新特性，包括隐藏类、EdDSA签名算法、模式匹配、记录类、封闭类和文本块等。 ... [详细]

蜡笔小新 2024-11-14 12:11:09
text
Python基础：使用NLTK和Python构建机器学习应用

本文节选自《NLTK基础教程——用NLTK和Python库构建机器学习应用》一书的第1章第1.2节，作者Nitin Hardeniya。本文将带领读者快速了解Python的基础知识，为后续的机器学习应用打下坚实的基础。 ... [详细]

蜡笔小新 2024-11-13 21:23:34
ip
机器学习的持续探索与进展

在机器学习领域，深入探讨了概率论与数理统计的基础知识，特别是这些理论在数据挖掘中的应用。文章重点分析了偏差（Bias）与方差（Variance）之间的平衡问题，强调了方差反映了不同训练模型之间的差异，例如在K折交叉验证中，不同模型之间的性能差异显著。此外，还讨论了如何通过优化模型选择和参数调整来有效控制这一平衡，以提高模型的泛化能力。 ... [详细]

蜡笔小新 2024-11-11 10:27:39
select
提升 Kubernetes 集群管理效率的七大专业工具

Kubernetes 在云原生环境中的应用日益广泛，然而集群管理的复杂性也随之增加。为了提高管理效率，本文推荐了七款专业工具，这些工具不仅能够简化日常操作，还能提升系统的稳定性和安全性。从自动化部署到监控和故障排查，这些工具覆盖了集群管理的各个方面，帮助管理员更好地应对挑战。 ... [详细]

蜡笔小新 2024-11-07 17:01:31
ip
a16z深入解析：代币设计的常见误区、优化策略及未来趋势分析

a16z深入解析：代币设计的常见误区、优化策略及未来趋势分析 ... [详细]

蜡笔小新 2024-11-06 14:52:58
text
投融资周报 | Circle 达成 4 亿美元融资协议，唯一艺术平台 A 轮融资超千万美元

投融资周报 | Circle 达成 4 亿美元融资协议，唯一艺术平台 A 轮融资超千万美元 ... [详细]

蜡笔小新 2024-11-05 04:56:42
text
Google 实验框架优化：实现更高效、更精准、更快速的测试

为了评估精心优化的模型与策略在实际环境中的表现，Google对其实验框架进行了全面升级，旨在实现更高效、更精准和更快速的在线测试。新的框架支持更多的实验场景，提供更好的数据洞察，并显著缩短了实验周期，从而加速产品迭代和优化过程。 ... [详细]

蜡笔小新 2024-11-04 21:02:34
text
开发者调查揭示：Python 备受青睐，PHP 成为最不受欢迎语言

Hired网站最新发布的开发者调查显示，Python 语言继续受到开发者的广泛欢迎，而 PHP 则被评为最不受欢迎的语言。该报告基于 Hired 数据科学团队对 13 个城市中 9800 名开发者的调查数据，深入分析了当前编程语言的使用趋势和开发者偏好。此外，报告还探讨了其他热门语言如 JavaScript 和 Java 的表现，并提供了对技术招聘市场的洞见。 ... [详细]

蜡笔小新 2024-11-03 14:37:24
ip
从2019年AI顶级会议最佳论文，探索深度学习的理论根基与前沿进展

从2019年AI顶级会议最佳论文，探索深度学习的理论根基与前沿进展 ... [详细]

蜡笔小新 2024-11-03 10:42:12
ip
理工科男女不容错过的神奇资源网站

十一长假即将结束，你的假期学习计划进展如何？无论你是在家中、思念家乡，还是身处异国他乡，理工科学生都不容错过一些神奇的资源网站。这些网站提供了丰富的学术资料、实验数据和技术文档，能够帮助你在假期中高效学习和提升专业技能。 ... [详细]

蜡笔小新 2024-11-01 11:51:44
ip
视觉图像的生成机制与英文术语解析

近期，Google Brain、牛津大学和清华大学等多家研究机构相继发布了关于多层感知机（MLP）在视觉图像分类中的应用成果。这些研究深入探讨了MLP在视觉任务中的工作机制，并解析了相关技术术语，为理解视觉图像生成提供了新的视角和方法。 ... [详细]

蜡笔小新 2024-10-30 09:47:50
ip
芒果XO网站的安全性评估

随着互联网的普及，网站的安全性成为用户关注的重点。本文将探讨芒果XO（www.mangoxo.com）是否存在病毒风险，并介绍常见的五种病毒类型。 ... [详细]

蜡笔小新 2024-11-13 19:48:42
ip
语义、实例与全景分割的对比分析（Comparative Analysis of Semantic, Instance, and Panoptic Segmentation）

图像分割技术在人工智能领域中扮演着关键角色，其中语义分割、实例分割和全景分割是三种主要的方法。本文对这三种分割技术进行了详细的对比分析，探讨了它们在不同应用场景中的优缺点和适用范围，为研究人员和从业者提供了有价值的参考。 ... [详细]

蜡笔小新 2024-10-29 18:51:14

我hi7娘

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章

物体|分校_ICLR2022：AI如何识别“没见过的东西”？

行早 发自 凹非寺量子位 | 公众号 QbitAI

VOS如何检测域外物体

作者简介

行早发自凹非寺
量子位 | 公众号 QbitAI